云主机

功能概述

云主机是运行在物理机上的虚拟机实例,具有独立的IP地址,可以访问公共网络,运行应用服务。

最佳实践

基本配置:

  • 电源:云主机在ui上关机时建议使用停止按钮,不要使用关闭电源,关闭电源操作相当于直接给云主机断电,可能导致云主机系统出现问题。
  • 计算规格在线修改:建议高级设置中开启计算规格在线修改,开启后支持在线修改云主机cpu数量和内存大小。首次开启需重启云主机生效。
  • 快照:快照数量建议不超过5个,快照数量太多会影响性能。建议使用灾备服务做数据备份。
  • 云主机显卡:对于Windows云主机,可以将集群高级设置中的云主机启动显卡类型调整为qxl,云主机内安装qxl驱动后支持调整分辨率。物理机的/opt/zstack-dvd/x86_64/c76/zstack-windows-virtio-driver.iso文件中带了该驱动。

云主机系统扩容:

云主机使用过程中可能会需要进行系统扩容,即扩容根盘,同时还需要在云主机系统内对文件系统进行扩容。常见的Windows云主机及linux云主机可以参考官网知识库中文章进行系统扩容。

云盘的厚置备与精简置备:

  • 精简置备:创建时只使用该磁盘最初所需要的数据存储空间。如以后需要更多空间,则它可以增长到为其分配的最大容量。
  • 厚置备:立刻分配指定大小的空间。
  • 精简置备可以节省主存储空间,但是在写速度超过云盘扩容速度时,会导致云主机暂停,影响业务。厚置备会占用全部的存储空间,在克隆或创建镜像时速度会较慢,但是读写性能相较于精简置备的云盘要更好。

注意事项

  • 云主机迁移:若云主机长时间处于高业务状态而影响迁移,可在迁移时勾选自动收敛模式,使云主机迁移能顺利完成。

    • 若应用对性能极为敏感,不建议启用自动收敛模式。
    • 若迁移时未勾选自动收敛模式导致云主机持续处于迁移中状态,可在云主机迁移前所在物理机上使用下列命令取消云主机迁移任务。

      watch -n 1 -d virsh domjobinfo uuid    ##观察云主机迁移状态,uuid需要换成云主机真实的uuid
      virsh domjobabort uuid    ##取消迁移任务,uuid需要换成云主机真实的uuid
      
  • 本地存储云主机热迁移:需要在全局设置-->基本设置中将本地存储在线迁移功能打开。

  • 跨集群高可用:

    • 二层网络指要实现跨集群高可用云主机使用的三层网络对应的二层网络。
    • 主存储指要实现跨集群高可用的云主机所使用的主存储,且主存储类型必须为共享存储如Ceph、SHAredBlock等。
    • 云主机云盘分布在多个主存储的情况下,要把云盘所使用的主存储都加载到集群。
  • 控制台代理:

    • 双管理节点使用自签的证书设置https时,使用vip访问云平台时可能会出现打开控制台时出现已失联的情况。
    • 需要分别使用两个管理节点的地址访问云平台,接受不安全的证书。
    • 使用两个单管理节点都能正常打开云主机控制台时,再使用vip访问云平台。
  • 性能优化工具:

    • linux系统,性能优化工具安装后可以获取更准确的监控数据。
    • Windows系统,性能优化工具安装后,可以获取更准确的监控数据以及安装virtio驱动。性能优化工具安装完成后建议在ui上重启,重启后观察ui上网卡类型是否变成了virtio。
    • 性能优化工具安装需要云主机使用的三层网络开启dhcp,且同一个二层网络只能加载一个三层网络,否则会导致云主机无法获取到内部监控数据。
    • 如果云主机加载了云盘,则无法安装性能优化工具,可参考官网知识库中文章进行处理。

扩展阅读

基础配置:

  • 标签:创建云主机时,可以给云主机绑定标签,通过标签达到区分云主机或给云主机分组的作用。
  • neverstop:对于停机容忍度低的云主机,高级设置中,可将高可用模式设置为neverstop。开启后,云主机关机后会自启动。如果希望云主机关机后不再启动,可以在ui上关机时勾选"勾选后,已启用高可用功能的云主机本次将不会自动重启"选项。
  • 资源优先级:建议仅对重要的云主机设置“高”资源优先级。当物理机负载率过高,出现资源竞争时,资源优先级为“高”的云主机较“正常”云主机具备更高的资源抢夺能力。
  • 根云盘:根云盘容量建议不要设置过大,后期容量不足可以进行扩容。建议业务数据新建一块数据云盘进行存放。当系统出现异常时,可以通过新建云主机,再将老的云盘挂载至新云主机快速恢复业务。

系统配置:

  • 控制台密码:对于安全性要求较高的云主机,建议设置控制台密码,控制台密码需要在6-8位之间。

    • 设置后,如果取消控制台密码,需要重启云主机生效。
  • 控制台模式:云平台主要有以下三种控制台模式,默认为vnc,可以按需设置控制台模式。

    • VNC:适用系统:windows、linux 网络流量:较小,常用100k左右 适用场景:主要用于linux的服务器的管理,由于无声音和usb传输,不满足于虚拟桌面的使用
    • SPICE:适用系统:linux 网络流量:较大,正常使用10-20M 适用场景:由于在色彩、音频和usb方面,适用于虚拟桌面,主要用于虚拟机的虚拟桌面应用 使用:安装后,需要在虚拟机中配置,参考本人关于虚拟机的blog。
    • RDP:目前在windows上 rdp有两种,remote,remotefx 适用系统:windows、linux 网络流量:较小,正常使用100-200k左右 适用场景:由于在色彩、音频、usb及本地磁盘映射方面较好,非常适用于虚拟桌面 windows 使用:系统安装后即可使用。
功能 SPICE VNIC RDP
BIOS屏幕显示 不能
全彩支持
更改分辨率
多显示器 多显示器支持(高达4画面) 只有一个屏幕 多显示器支持
图像传输 图像和图形传输 图像传输 图像和图形传输
视频播放支持 GPU加速支持 不能 GPU加速支持
音频传输 双向语音可以控制 不能 双向语音可以控制
鼠标控制 客户端服务器都可以控制 服务器端控制 服务器端控制
USB传输 USB可以通过网络传输 不能 USB可以通过网络传输

云主机高可用:

当某台物理机异常断电或宕机时,会导致该物理机上的云主机关机,对于业务连续性要求高的云主机,我们希望能自行在集群内的其它物理机上启动。平台提供了策略来达到这种需求(需要主存储的类型为共享存储,如Ceph、SharedBlock等)。

  • 全局设置-->高级设置中开启云主机高可用全局开关。
  • 全局设置-->基本设置中云主机高可用策略设置为激进模式。
  • 云主机高可用级别设置为neverstop。
  • 云主机的HA动作:
    • permissive表示高可用策略为保守模式,force表示高可用策略为激进模式。
    • HA表示云主机高可用级别为neverstop,none表示云主机高可用级别为none。
    • 云主机高可用级别设置为neverstop时,需要将全局设置中的云主机高可用全局开关打开才能生效。
Permissive HA none
存储网和管理网都故障 vm不被self-fencer kill,vm状态会变为unknow vm不被self-fencerkillvm状态变为unknown
存储网故障,管理网正常 vm不被self-fencer kill,vm状态为以物理机上状态为准 vm不被self-fencer kill,vm状态为以物理机上状态为准
存储网正常,管理网故障 vm不被self-fencer kill,状态为unknown vm不被self-fencer kill,状态为unknown
Force HA none
存储网和管理网都故障 vm被self-fencer kill,然后从另一台host启动 vm被self-fencer kill,vm变为stopped
存储网故障,管理网正常 vm被self-fencer kill,然后从另一台host启动 vm被self-fencer kill状态变为stopped
存储网正常,管理网故障 vm不被self-fencer kill,状态为unknown vm不被self-fencer kill状态变为unknown

跨集群高可用:

表示云主机在不同集群之间实现高可用。要实现该功能,满足下列所有条件即可。

  • 全局设置-->高级设置中开启云主机高可用全局开关。
  • 全局设置-->基本设置中云主机高可用策略设置为激进模式。
  • 云主机高可用级别设置为neverstop。
  • 全局设置-->高级设置中开启云主机跨集群高可用开关。
  • 集群加载相同的二层网络和主存储。

云主机创建原理图:

image-20220907134815002

results matching ""

    No results matching ""